谷歌DeepMind宣布成功将“记忆”融入人工智能，通用型AI又迈进一步？

2017-03-24 创新工场

AI距离人类智慧究竟还有多长的路要走？

问题突破口之一便是发展“通用型人工智能”。

“人类和动物能够掌握大量知识的一个关键因素，就在于他们可以在以前知识的基础上不断学习新东西。”具备知识技能迁移能力，代表可以关联不同的任务，充分利用已掌握的技能来解决新的问题。具备这种能力的AI，便在接近人类智慧的道路上更进了一步。

本文转载自： DeepTech深科技

当下，人工智能概念大火，仿佛未来人类的一切都将被AI所接管，但实际上，人工智能的发展中仍有一个特别棘手的问题有待解决，那就是机器无法像人类一样自由灵活的运用通用智慧来应对挑战。换言之：人工智能在运用过去的经验和知识方面是受限的。同理，答案就在问题中，发展“通用型人工智能（artificial general intelligence）”就成了是最明确的主攻方向。

如今，谷歌的DeepMind团队刚刚发表的新论文《Enabling Continual Learning in Neural Network》就又在这一问题上取得了突破，其联合帝国理工学院开发出一套名为弹性权重固化（elastic weight consolidation）新的算法，描述了让机器学习、记住并重新使用信息将成为可能。

DeepMind的James Kirkpatrick就说：“如果我们想要拥有更智能、更有应用价值的计算机程序，那么，它就必须具备“通用型人工智能”的能力。”

人机有别

对于人类来说，知识技能的迁移是再正常不过的事情了，最典型的例子是：一个专业的滑雪玩家往往在滑冰上面也会表现的得心应手。但这一步的跨越对于人工智能来说却是不小的挑战。

其症结在于大多数的人工智能系统都是基于所谓的神经网络来解决问题，就像DeepMind的 AI 可以学会下围棋或打扑克，这其实都是在经历了无数次的训练和失误之后才练就的技能。但这两种技能实际上是不能并存的，就比如AI学会了打扑克，那它就必须要把有关下围棋的知识抹除掉。想来也是可惜，难怪研究人员将之称为“灾难性遗忘”。

这一问题得不到解决，人工智能就永远不会达到人类的智慧程度，自然其解决问题灵活程度也就不会和人类看齐。“人类和动物能够掌握大量知识的一个关键因素，就在于他们可以在以前知识的基础上不断学习新东西。”Kirkpatrick说。

而为了实现这一目标，研究人员首先在神经科学领域进行了探索，他们发现，动物是通过保持住头脑中关于过往技能印象，来实现不断的学习，而这往往也是在面临生存的压力使所不得不做出的抉择，就比如老鼠如果不能快速地学会寻找食物的技能，那它们很快就会被饿死。

DeepMind新的AI程序同时应付两个任务的学习过程

早在 2014 年，DeepMind通过用机器学习的方法，教会AI玩一款Atari公司出品的游戏，由此突然间吸引了极大关注。那时，AI可以做到顺利通关，并取得比人类更高的得分，但却不能记住它赢得游戏的过程。

玩每一款Atari公司出品的游戏，AI都需要创建一个单独的神经网络。一旦没有把游戏相关的信息传递给计算机，AI 就无法运行这一款游戏。

如今，DeepMind 联合帝国理工学院开发出一套新的算法，让神经网络学习、记住并重新使用信息成为可能。这种名为弹性权重固化（elastic weight consolidation）的算法所依赖的是“突触固化（synaptic consolidation）”理论。在人脑中，这一点被称为学习和记忆的基础。

Atari公司出品的游戏

论文称：“我们的方法是通过有选择性地减慢对重要权重值的学习，使机器能记住之前的任务。”

Kirkpatrick解释说，算法会选择运用它所学习的内容来玩一款游戏，然后保留其中学到的最为重要的部分。他也提到，“我们只允许程序间非常缓慢地渐进式的改变，那样的话才总是会有学习新任务的空间，而同时这种改变不会覆盖我们之前学到的内容。”

在测试中，研究人员利用被新算法强化过的DQN深度神经网络随机玩10款Atari公司的游戏，几天之后，他们发现AI已经可以做到和人类玩家一样优秀了，这其中很大的一部分功劳都在于这种新的算法。没了它，人工智能几乎学不会其中任何一个游戏。

Kirkpatrick说，“我们之前的游戏AI只能学习玩一款游戏，而如今我们新发布的系统已经对多款游戏都得心应手了。”

在AI玩游戏的过程中，研究人员还注意到一些有趣的现象。例如，当AI在玩赛车类游戏的时候，对于游戏中的白天、晚上、雪等不同的场景，AI已经可以将它们分解为不同的任务来一一进行解决了，这倒是很出乎大家的预料。

DeepMind新算法与其他算法的对比

然而，紧接着又有新的问题出现了，那就是研究人员无法证明，AI是否可以把每一款游戏都玩到极致。概括来讲，AI虽然已经可以利用学过的知识来解决现有的问题，但它是否会因为运用这种方法而将问题解决的更好，还值得商榷。“对于AI来说，还有改进的余地。”Kirkpatrick说。

而AI没有精通每一款游戏的一个原因就在于，它对于游戏策略的运用仍然非常茫然。“虽然我们知道连贯学习的重要性，但我们始终没能做出突破，进入到模拟人类和动物那种学习模式的阶段。这的确是一个艰难的挑战，但我们知道没有什么事是不可逾越的。”Kirkpatrick说。

“我们距离通用型人工智能还有很长的路要走，也还有很多的研究和挑战需要解决”，Kirkpatrick补充道。“关键在于，搭建起一个可以学习解决新任务和新挑战的系统，同时还要继续保留他们已经学到的技能。而我们所做的研究就是朝这个方向所做的一个有意义的摸索。”

伦敦大学学院Gatsby计算神经科学科主任Peter Dayan也十分称赞这项研究工作。他说，计算机如果实现通用型人工智能就意味着，它已经可以做到将不同任务进行关联，充分利用已掌握的技能来解决新的问题。

但质疑的声音自然也是存在的。英国西部大学布里斯托机器人实验室的Alan Winfield说，这项研究的确很好，但它显然没有做到更接近通用人工智能。至少，DeepMind的专家们没有透露学习能力的迁移是如何具体操作的，我们到底能不能直接运用它也都还没有定论。

扩展阅读：

人工智能的最大挑战是道德问题，它们的行为动机无法确定

李开复预期AI投资过热，明年将经历泡沫和调整期

科技与人工智能正在埋没人类的未来？

李开复与MIT实验室负责人焦点对谈：AI时代的变革比每一次工业革命都快

清华女神，34岁的美女博士县长，辞职了

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！